Un outil de détection automatique de thèmes

نویسنده

  • Laurence Longo
چکیده

Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de recherche, (Qristal, Intuition), (Illouz et al., 2000). Les moteurs de recherche actuels « plein texte » sélectionnent l’ensemble des documents contenant les mots-clés de la requête utilisateur. Nombreux sont les documents proposés à l’utilisateur qui ne comportent pas les informations attendues ; parfois même, des documents pertinents ne sont pas retrouvés par les moteurs. Ce manque de pertinence est dû à la méthode d'indexation par mots-clés, qui ne tient pas compte des propriétés linguistiques des textes (syntaxe, sens, genre etc.). Un aspect peu exploité à présent réside dans l’indexation automatique des documents par thèmes. Dans la lignée des méthodes hybrides existantes (Hernandez, 2004), nous allons combiner des méthodes statistiques à des méthodes linguistiques pour identifier automatiquement des thèmes et les proposer comme descripteurs de documents. Dans notre approche, les thèmes textuels constituent les sujets d’un texte, ou d’un fragment de document et sont posés comme agrégats des thèmes phrastiques (Goutsos, 1997). Ainsi, en plus des mots-clés, les documents seront décrits par leurs thèmes. Lors d’une recherche, les termes des requêtes utilisateur seront reliés aux thèmes déjà utilisés pour identifier les documents. Des thèmes associés pourront être proposés à l’utilisateur comme alternative et des documents associés au document consulté (i.e. comportant des thèmes proches) lui seront aussi proposés ; toujours dans une optique d’aide à la lecture et à la navigation.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Vers un résumé automatique de séries télévisées basé sur une recherche multimodale d'histoires

RÉSUMÉ. Les séries télévisées récentes multiplient les personnages principaux, développant ainsi des intrigues complexes présentées à travers plusieurs histoires entremêlées. Nous proposons une approche de détection automatique de ces histoires afin de générer un résumé vidéo par extraction de scènes représentatives de ces dernières, et nous présentons un outil de visualisation rapide des histo...

متن کامل

Détection et regroupement automatique de style d'écriture dans un texte

Résumé. La détection de plagiat extrinsèque devient vite inefficace lorsque l’on n’a pas accès aux documents potentiellement sources du plagiat ou lorsque l’on se confronte à un espace aussi vaste que le Web, ce qui est souvent le cas dans les logiciels anti-plagiat actuels. Dès lors la détection intrinsèque devient nettement plus efficace. Dans cet article, nous traitons justement de la détect...

متن کامل

Détection visuelle d'anomalies de conception

Résumé. De nos jours, les logiciels doivent être flexibles pour pouvoir accommoder d’éventuels changements. Les anomalies de conception introduites durant l’évolution du logiciel causent souvent des difficultés de maintenance. Cependant, la détection d’anomalies de conception n’est pas triviale. La détection manuelle est coûteuse en temps et en ressources, alors que la détection automatique gén...

متن کامل

Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables

Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...

متن کامل

A Method for Detecting Artificial Objects in Natural Environments

Résumé Dans cet article nous allons présenter une méthode pour la détection automatique d’objets artificiels dans des images numériques représentant des milieux naturels. Cette méthode est basée sur la distribution statistique des motifs de texture dans l’image. Cette distribution est calculée en utilisant la loi de Zipf. L’image est divisée en imagettes et la distribution de Zipf est calculée ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009